# Обработка и исполнение запросов в СУБД (Лекция 8)

Колоночные СУБД в оперативной памяти

v6

Георгий Чернышев

Высшая Школа Экономики chernishev@gmail.com

21 октября 2020 г.

#### План

Paccmorpum систему MonetDB- колоночную систему в оперативной памяти.

- MonetDB, ее принципы устройства, планы запросов
- Аппаратные основания для появления MonetDB
- MonetDB как исследовательская платформа:
  - Cache-conscious соединение
  - Database cracking
  - Recycler
- Буфер-менеджер "на пальцах"
- MonetDB/X100



### MonetDB — колоночная СУБД в памяти

Вкратце из статей, например [Boncz and Kersten, 1999, Boncz et al., 2008]:

- Данные представлены в виде ВАТ структур (Binary Association Table): набор пар (key, value);
- Над ВАТ есть своя алгебра: каждый оператор работает над одним или несколькими ВАТ, возвращает ВАТ;
- He Volcano, a operator-at-a-time model;
- Каждый оператор очень простой. Фактически, реализация операций над массивом;
- Все данные в памяти, mmap-ом отображаются на диск, если виртуальной памяти не хватит, используем за-mmap-леную дисковую, есть подсистема (это вместо буфер-менеджера).

Этот подход позволяет очень эффективно использовать процессор и оперативную память.

#### Простой пример



SELECT id, name, (age-30)\*50 as bonus

FROM people WHERE age > 30

<sup>1</sup>Изображение взято из [Harizopoulos et al., 2009]

40.40.41.41.1 1 000

# Пример посложнее (смотрите в план в pdf)

| SQL example query |                                                                        |  |  |  |  |  |  |
|-------------------|------------------------------------------------------------------------|--|--|--|--|--|--|
| SELECT            | item.id AS id,                                                         |  |  |  |  |  |  |
|                   | item.price*item.tax AS total                                           |  |  |  |  |  |  |
| WHERE             | order.id = item.order AND                                              |  |  |  |  |  |  |
|                   | order.discount BETWEEN 0.00 AND 0.06                                   |  |  |  |  |  |  |
| ORDER E           | BY total,id                                                            |  |  |  |  |  |  |
|                   | MIL translation (annotated below)                                      |  |  |  |  |  |  |
| ORD_NIL           | := select(order_discount, "between", 0.0, 0.06)                        |  |  |  |  |  |  |
| 1                 | a bat [oid, oid], head column with selected order-oids, nils in tail   |  |  |  |  |  |  |
| IDS_NIL           | := join(order_id.reverse,ORD_NIL,"=")                                  |  |  |  |  |  |  |
| 2                 | creates a bat [oid,oid] with selected order-IDs in head, nil tail      |  |  |  |  |  |  |
| ITM_NIL           | := join(item_order, IDS_NIL, "=")                                      |  |  |  |  |  |  |
| 3                 | creates a bat [oid,oid] with selected item-IDs in head, nil tail       |  |  |  |  |  |  |
| UNQ_ITM           | := mark(ITM_NIL,oid(0)).reverse                                        |  |  |  |  |  |  |
| 4                 | creates a bat [oid, oid] fresh oids in head, selected item-IDs in tail |  |  |  |  |  |  |
| UNQ_PRI           | := join(UNQ_ITM,item_price,"=")                                        |  |  |  |  |  |  |
| 5                 | creates a bat [oid, flt] with selected item-IDs and their prices       |  |  |  |  |  |  |
| UNQ_TAX           | := join(UNQ_ITM,item_tax,"=")                                          |  |  |  |  |  |  |
| 6                 | creates a bat [oid, flt] with selected item-IDs and their taxes        |  |  |  |  |  |  |
| UNQ_TOT           | := [*] (UNQ_PRI,UNQ_TAX)                                               |  |  |  |  |  |  |
|                   | creates a bat [oid, flt] with selected item-IDs and totals             |  |  |  |  |  |  |
| table("           | 2,1",UNQ_ITM,UNQ_TOT)                                                  |  |  |  |  |  |  |
|                   | prints a 2-column table with item IDs and totals, with major           |  |  |  |  |  |  |
|                   | ordering on the second column, and secondary ordering on the first     |  |  |  |  |  |  |

Fig. 4. A simple SQL query and a MIL translation

# Про "железо" "на пальцах" І

#### Elements:

- Storage
  - 1 CPU caches L1/L2/L3
- 1 Registers
- 1 Execution Unit(s)
  - 1 Pipelined
  - 1 SIMD



<sup>&</sup>lt;sup>3</sup>Изображение взято из [Harizopoulos et al., 2009]

## Про "железо" "на пальцах" II (SIMD)

### SIMD



- Single Instruction Multiple Data
  - Same operation applied on a vector of values
  - MMX: 64 bits, SSE: 128bits, AVX: 256bits
  - SSE, e.g. multiply 8 short integers

# Про "железо" "на пальцах" III (эволюция процессоров)

| Microprocessor              | 16-bit<br>address/<br>bus,<br>microcoded | 32-bit<br>address/<br>bus,<br>microcoded | 5-stage<br>pipeline,<br>on-chip I & D<br>caches, FPU | 2-way<br>superscalar,<br>64-bit bus | Out-of-order<br>3-way<br>superscalar | Out-of-order<br>superpipelined,<br>on-chip L2<br>cache | Multicore<br>OOO 4-way<br>on chip L3<br>cache, Turbo |
|-----------------------------|------------------------------------------|------------------------------------------|------------------------------------------------------|-------------------------------------|--------------------------------------|--------------------------------------------------------|------------------------------------------------------|
| Product                     | Intel 80286                              | Intel 80386                              | Intel 80486                                          | Intel Pentium                       | Intel Pentium Pro                    | Intel Pentium 4                                        | Intel Core i7                                        |
| Year                        | 1982                                     | 1985                                     | 1989                                                 | 1993                                | 1997                                 | 2001                                                   | 2010                                                 |
| Die size (mm <sup>2</sup> ) | 47                                       | 43                                       | 81                                                   | 90                                  | 308                                  | 217                                                    | 240                                                  |
| Transistors                 | 134,000                                  | 275,000                                  | 1,200,000                                            | 3,100,000                           | 5,500,000                            | 42,000,000                                             | 1,170,000,000                                        |
| Processors/chip             | 1                                        | 1                                        | 1                                                    | 1                                   | 1                                    | 1                                                      | 4                                                    |
| Pins                        | 68                                       | 132                                      | 168                                                  | 273                                 | 387                                  | 423                                                    | 1366                                                 |
| Latency (clocks)            | 6                                        | 5                                        | 5                                                    | 5                                   | 10                                   | 22                                                     | 14                                                   |
| Bus width (bits)            | 16                                       | 32                                       | 32                                                   | 64                                  | 64                                   | 64                                                     | 196                                                  |
| Clock rate (MHz)            | 12.5                                     | 16                                       | 25                                                   | 66                                  | 200                                  | 1500                                                   | 3333                                                 |
| Bandwidth (MIPS)            | 2                                        | 6                                        | 25                                                   | 132                                 | 600                                  | 4500                                                   | 50,000                                               |
| Latency (ns)                | 320                                      | 313                                      | 200                                                  | 76                                  | 50                                   | 15                                                     | 4                                                    |
| Memory module               | DRAM                                     | Page mode<br>DRAM                        | Fast page<br>mode DRAM                               | Fast page<br>mode DRAM              | Synchronous<br>DRAM                  | Double data<br>rate SDRAM                              | DDR3<br>SDRAM                                        |
| Module width (bits)         | 16                                       | 16                                       | 32                                                   | 64                                  | 64                                   | 64                                                     | 64                                                   |
| Year                        | 1980                                     | 1983                                     | 1986                                                 | 1993                                | 1997                                 | 2000                                                   | 2010                                                 |
| Mbits/DRAM chip             | 0.06                                     | 0.25                                     | 1                                                    | 16                                  | 64                                   | 256                                                    | 2048                                                 |
| Die size (mm <sup>2</sup> ) | 35                                       | 45                                       | 70                                                   | 130                                 | 170                                  | 204                                                    | 50                                                   |
| Pins/DRAM chip              | 16                                       | 16                                       | 18                                                   | 20                                  | 54                                   | 66                                                     | 134                                                  |
| Bandwidth (MBytes/s)        | ) 13                                     | 40                                       | 160                                                  | 267                                 | 640                                  | 1600                                                   | 16,000                                               |
| Latency (ns)                | 225                                      | 170                                      | 125                                                  | 75                                  | 62                                   | 52                                                     | 37                                                   |
|                             |                                          |                                          |                                                      |                                     |                                      |                                                        |                                                      |



<sup>&</sup>lt;sup>5</sup>Изображение взято из [Hennessy and Patterson, 2011]

# Про "железо" "на пальцах" IV (25 лет эволюции RAM)



# Про "железо" "на пальцах" V (иерархия носителей)



<sup>&</sup>lt;sup>7</sup>Изображение взято из [Hennessy and Patterson, 2011]

# Про "железо" "на пальцах" VI (стоимость операций)



Distance which light travels while the operation is performed













#### Э кеш-памяти

#### Бывает:

- Кеш данных хранит данные, которыми оперирует программа,
- Кеш инструкций хранит саму программу.



#### Как выглядит код в кеш-памяти



Fig. 1. Example of a two-way set associative, four-set (eight cache blocks) L1-I cache. Code stored in RAM maps to one set of cache blocks and is stored to any of the two blocks in that set. For simplicity, we omit L2/L3 caches. In this example, the *for-loop* code fits in the cache only if procedure A is never called. In that case, repeated executions of the code will always hit in the L1-I cache. Larger code (more than eight blocks) would result in *capacity* misses. On the other hand, frequent calls to A would result to *conflict* misses because A's code would replace code lines f3 and f4 needed in the next iteration.

<sup>&</sup>lt;sup>10</sup>Изображение взято из [Harizopoulos and Ailamaki, 2006]

### Кеш-память и цифры

- L1 кеш 8-64KB (и данные, и инструкции), больше не будет:
  - придется снижать частоту, температура
- В OLTP код занимает 556 KB, смотри ссылку из [Harizopoulos and Ailamaki, 2006].

То есть, для достижения хорошей производительности надо писать "правильный" код.

### Про "железо" "на пальцах" VII: конвейер



 ${\sf Komy\ he} {\sf пohstho},\ {\sf читайтe\ https://en.wikipedia.org/wiki/Instruction\_pipelining}.$ 

## Про "железо" "на пальцах" VIII: проблемы выполнения

Data hazards Control Hazards Dependencies between instructions Branch mispredictions L1 data cache misses Computed branches (late binding) L1 instruction cache misses

Result: bubbles in the pipeline



| fetch              | 15-1 | 15-2 | 11-3 | IF-4 | 11-0         | 15-0 | 1/1//// | 11/1/1/ | 2211111 | IF=/ |
|--------------------|------|------|------|------|--------------|------|---------|---------|---------|------|
| ictori             | !    | !    | !    | !    | !            | !    | !       | !       | !!!     |      |
| Instruction decode |      | ID-1 | ID-2 | ID-3 | ID-4         | ID-5 | ID-6    | 10/1/   | 10/8/   |      |
| accode             |      | i    |      | i    |              | i    |         |         |         | i    |
| Execute            |      |      | EX-1 | EX-2 | <b>EX-</b> 3 | EX-4 | EX-5    | EX-6    | EX-7    |      |
|                    | 1    | l .  | ı    | I    | ı            | ı    | l .     | ı       |         |      |
| Write back         |      |      |      | WB-1 | WB-2         | WB-3 | WB-4    | WB-5    | WB-6    |      |
|                    |      |      |      |      |              |      |         |         |         |      |



ID-7



control hazards typically more expensive

<sup>&</sup>lt;sup>12</sup>Изображение взято из [Harizopoulos et al., 2009]

# Как себя ведет процессор под нагрузкой (итераторами) І

DB workload execution on a modern computer



"DBMSs On A Modern Processor: Where Does Time Go?" Ailamaki, DeWitt, Hill, Wood, VLDB'99

# Как себя ведет процессор под нагрузкой (итераторами) II

Вкратце из статьи [Boncz et al., 2005]:

- TPC-H 1GB, Q1 (выборки, агрегация)
- Итог:
  - C program: 0.2s
  - MySQL: 26.2s
  - DBMS "X": 28.1s

# Как такой (MonetDB) подход помогает?

Вот так [Boncz et al., 2008, Harizopoulos et al., 2009]:

- "Хороший" с точки зрения СРИ код:
  - Меньше зависимостям по данным;
  - Меньше зависимостям по управлению;
  - Можно автоматически генерировать SIMD-код.
- Один цикл для целой колонки:
  - Отказ от работы на уровне записи;
  - Массивы позволяют переходить по смещениям;
  - Лучше ситуация с кешем инструкций.

```
for(i=0; i<n; i++)
res[i] = col[i] - val;
}</pre>
```

Итог: Monet около 4s.



## Проблемы

Материализация результата [Boncz et al., 2008, Harizopoulos et al., 2009]:



Памяти просто может не хватить, не будет масштабируемости.

<sup>&</sup>lt;sup>14</sup> Изображение взято из [Harizopoulos et al., 2009]

#### Ниша: исследовательская платформа 1

Figure 2: MonetDB: a BAT algebra machine.



 $<sup>^{15}</sup>$ Изображение взято из [Harizopoulos et al., 2009]

#### Ниша: исследовательская платформа II

- Cache-Conscious Joins
  - Cost Models, Radix-cluster Radix-decluster
- MonetDB/XQuery:
  - structural joins exploiting positional column access
- Cracking:
  - on-the-fly automatic indexing without workload knowledge
- Recycling:
- Run-time Query Optimization:
  - correlation-aware run-time optimization without cost model

- "Database Architecture Optimized for the New Bottleneck: Memory Access" VLDB'99
- •"Generic Database Cost Models for Hierarchical Memory Systems", VLDB'02 (all Manegold, Boncz, Kersten)
- "Cache-Conscious Radix-Decluster Projections". Manegold, Boncz, Nes, VLDB'04

"MonetDB/XQuery: a fast XQuery processor powered by a relational engine" Boncz, Grust, vanKeulen, Rittinger, Teubner, SIGMOD'06

"Database Cracking", CIDR'07 "Updating a cracked database", SIGMOD'07 "Self-organizing tuple reconstruction in columnstores", SIGMOD'09 (all Idreos, Manegold, Kersten)

"An architecture for recycling intermediates in a using materialized intermediates column-store", Ivanova, Kersten, Nes, Goncalves, SIGMOD'09

> "ROX: run-time optimization of XQueries". Abdelkader, Boncz, Manegold, vanKeulen, SIGMOD'09

<sup>16</sup> Изображение взято из [Boncz et al., 2008]

## Cache-Conscious Соединение

Как работает [Shatdal et al., 1994], существующий Grace Hash-Join вариант:

- Оба отношения фрагментируем (по хеш-коду атрибутов соединения) на Н кластеров;
- Каждый кластер помещается в L2 кеш;
- Для каждого кластера "прикладываем" элементы соответствующего фрагмента из второго отношения.

## Проблемы Cache-Conscious Соединения

#### Часть с кластеризацией — проблемная:

- Алгоритм имеет один скан и кластеризацию, пишет в Н случайных регионов (кластеров), это портит шаблон доступа к памяти;
- Если Н слишком велико то:
  - записей в TLB может не хватить, будет TLB miss;
  - линеек в кеше может не хватить, будет засорение кеша и будут L1, L2 cache miss;
- $\longrightarrow$  придумали radix-cluster алгоритм.

## Про "железо" "на пальцах" IX: TLB

Translation Lookaside Buffer (TLB):

- Тоже "кеш-память", встроена в CPU, обеспечивает работу виртуальной памяти;
- "Помнит" последние трансляции логических в физические адреса (обычно 64-96 штук);
- Адресует страницы в оперативной памяти:
  - на каждый load/store нужна одна трансляция
  - нашлась получили адрес сразу же
  - не нашлась: TLB miss, идем в RAM смотрим в TLB таблицу (тут тоже может быть цепочка из промахов)
- При 4КВ странице, 64 записи, можно встретить TLB miss при случайном доступе к структурам (хеш-таблицам, например) размером больше чем 256КВ.

Сейчас всё сложнее, например на Sandy Bridge отдельные TLB для разных размеров<sup>17</sup>.

 $^{17} \mathrm{https://stackoverflow.com/questions/40649655/}$ 

how-is-the-size-of-tlb-in-intels-sandy-bridge-cpu-determined

#### Предложенное решение: radix cluster I





Black tuples hit (lowest 3-bits of values in parenthesis)

 $<sup>^{18}</sup>$ Изображение взято из [Boncz et al., 2008]

### Предложенное решение: radix cluster II

- Перестановка происходит только в рамках блока, лучше паттерн доступа, меньше вероятность промахов;
- Обычно хешируют, и работают с хеш-кодами, хотя на рисунке это не показано;
- Если колонка начинается с 0 и плотна, можно не хешировать, будет radix-sort.

## Эксперименты І



 $<sup>^{19}</sup>$ Изображение взято из [Boncz et al., 2008]

## Эксперименты ||



4 D > 4 A > 4 B > 4 B > B 9 9 0

 $<sup>^{20}</sup>$ Изображение взято из [Boncz et al., 2008]

## Database Cracking: идея

Physically reorganize based on the selection predicate



 $<sup>^{21}</sup>$ Изображение взято из [Harizopoulos et al., 2009]

## Применения Cracking

- Выше было описано как применять к колонкам при запросах на выборку (selection cracking);
- Кроме того, можно заменить восстановление записи на cracking (например, вспомните прошлую лекцию, место про соединение и нарушение порядка) — sideways cracking.

## Database Cracking: эксперименты



 $<sup>^{22}</sup>$ Изображение взято из [Harizopoulos et al., 2009]

#### Recycler I: дерево запроса



Fig. 1. MAL plan of the example query

Fig. 2. Execution plan marked by the recycler optimiser

 $<sup>^{23}</sup>$ Изображение взято из [Ivanova et al., 2010]

#### Recycler II: идея

- Полная материализация промежуточных результатов можно переиспользовать некоторые из них:
  - Локально: в рамках одного плана + в рамках шаблона;
  - Глобально: в рамках нескольких параллельно идущих запросов;
- Кеш с политикой допуска:
  - KEEPALL храним всё;
  - CREDIT экономические принципы;
- ...и с политикой вытеснения:
  - LRU;
  - Benefit policy;
  - History policy.



### Recycler III: сколько можно сэкономить?

|       | Instructions |       |       |       | Time (s) |       |       |  |
|-------|--------------|-------|-------|-------|----------|-------|-------|--|
| Query | #            | Intra | Inter | Total | Savings  |       |       |  |
|       |              | %     | %     |       | Pot.     | Local | Glob. |  |
| Q1    | 36           | 2.8   | 0     | 5.72  | 3.54     | 0.30  | 0     |  |
| $Q_2$ | 106          | 0.9   | 2.8   | 0.22  | 0.22     | 0     | 0.07  |  |
| Q3    | 39           | 0     | 5.1   | 2.61  | 2.40     | 0     | 0     |  |
| Q4    | 36           | 0     | 41.7  | 1.72  | 1.65     | 0     | 1.44  |  |
| $Q_5$ | 74           | 0     | 2.7   | 1.16  | 1.15     | 0     | 0     |  |
| Q6    | 11           | 0     | 0     | 0.53  | 0.52     | 0     | 0     |  |
| Q7    | 106          | 3.8   | 3.8   | 1.61  | 1.11     | 0.36  | 0.56  |  |
| Q8    | 61           | 0     | 6.6   | 0.60  | 0.56     | 0     | 0.16  |  |
| Q9    | 59           | 0     | 3.4   | 1.38  | 1.25     | 0     | 0     |  |
| Q10   | 54           | 0     | 3.7   | 1.37  | 1.34     | 0     | 0.20  |  |
| Q11   | 36           | 33.3  | 2.8   | 0.16  | 0.16     | 0.03  | 0     |  |
| Q12   | 6            | 0     | 33.3  | 1.17  | 0.55     | 0     | 0     |  |
| Q13   | 17           | 0     | 11.8  | 2.88  | 1.27     | 0     | 0     |  |
| Q14   | 18           | 0     | 0     | 0.21  | 0.21     | 0     | 0     |  |
| Q15   | 12           | 0     | 0     | 0.23  | 0.19     | 0     | 0     |  |
| Q16   | 14           | 0     | 42.9  | 0.88  | 0.27     | 0     | 0.01  |  |
| Q17   | 29           | 0     | 3.4   | 0.96  | 0.95     | 0     | 0     |  |
| Q18   | 12           | 0     | 75.0  | 1.83  | 1.70     | 0     | 1.68  |  |
| Q19   | 39           | 15.4  | 7.7   | 3.72  | 1.69     | 0.99  | 0.49  |  |
| Q20   | 25           | 0     | 12.0  | 0.95  | 0.82     | 0     | 0.01  |  |
| Q21   | 154          | 9.1   | 12.3  | 5.80  | 5.38     | 0.72  | 2.94  |  |
| Q22   | 4            | 0     | 75.0  | 0.65  | 0.15     | 0     | 0.15  |  |

Table II. Characteristics of TCP-H queries

 $<sup>^{24}</sup>$ Изображение взято из [Ivanova et al., 2010]

# Recycler VI: тест на реальной базе

Sloan Digital Sky Servey/ SkyServer http://cas.sdss.org

- 1 100 GB subset of DR4
- 1 100-query batch from January 2008 log
- 1.5GB intermediates, 99% reuse
- Join intermediates major consumer of memory and major contributor to savings



<sup>25</sup>Изображение взято из [Ivanova et al., 201 Георгий Чернышев (ВШЭ) Обработка

#### Данные на диске в строчных системах

#### В двух словах (очень приблизительно):

- Данных хранятся на диске;
- Считываются и временно хранятся в памяти;
- Обычно какой-то memory mapping;
- Менджер буферов (buffer-manager): считывание, удержание в памяти, модификация данных, сброс на диск;
  - pin/unpin;
  - алгоритм замещения: LRU, Clock algorithm, MRU, ...
- "Нарезка" на страницы: единицы оперирования менеджера буферов, 4-8 КВ;
- Зачем это всё? Управление ресурсами + data sharing.

#### Кому интересно дальше:

https://web.stanford.edu/class/cs346/2015/notes/Lecture\_One.pdf Как представлять страницу? Уже обсуждали.

#### Напоминание: слотированная страница



# MonetDB/X100 [Boncz et al., 2005]

- Избавились от полной материализации и добавили pipelining;
- Сделали "векторизацию": в кеше массив из ста элементов;
  - Все вектора должны помещаться в кеш!
- Такие же простые операторы цикла для обработки;
- Поздняя материализация + selection vectors: col[sel[i]];

Итог: MonetDB/X100: 0.6s (слайд 16)

### MonetDB/X100: архитектура



 $<sup>^{27}</sup>$ Изображение взято из [Harizopoulos et al., 2009]

#### Пояснение про selection vectors

```
map_mul_flt_val_flt_col(
  float *res,
  int* sel,
  float val,
  float *col, int n)
  for(int i=0; i<n; i++)
         res[i] = val * col[sel[i]];
selection vectors used to reduce
vector copying
contain selected positions
```



"MonetDB/X100: Hyper-Pipelining Query Execution" Boncz, Zukowski, Nes, CIDR'05

<sup>&</sup>lt;sup>28</sup>Изображение взято из [Harizopoulos et al., 2009]

## MonetDB/X100: размер вектора I



<sup>&</sup>lt;sup>29</sup>Изображение взято из [Harizopoulos et al., 2009]

## MonetDB/X100: размер вектора II



<sup>&</sup>lt;sup>30</sup>Изображение взято из [Harizopoulos et al., 2009]

## MonetDB/X100: размер вектора III



#### Ссылки I

- Milena G. Ivanova, Martin L. Kersten, Niels J. Nes, and Romulo A.P. Gonçalves. 2010. An architecture for recycling intermediates in a column-store. ACM Trans. Database Syst. 35, 4, Article 24 (October 2010), 43 pages. DOI=10.1145/1862919.1862921 http://doi.acm.org/10.1145/1862919.1862921
- Ambuj Shatdal, Chander Kant, and Jeffrey F. Naughton. 1994. Cache Conscious Algorithms for Relational Query Processing. In Proceedings of the 20th International Conference on Very Large Data Bases (VLDB '94), Jorge B. Bocca, Matthias Jarke, and Carlo Zaniolo (Eds.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 510–521.
- Peter A. Boncz, Martin L. Kersten, and Stefan Manegold. 2008. Breaking the memory wall in MonetDB. Commun. ACM 51, 12 (December 2008), 77–85. DOI=http://dx.doi.org/10.1145/1409360.1409380
- Peter Boncz, Marcin Zukowski, Niels Nes. MonetDB/X100: Hyper-Pipelining Query Execution. CIDR'05.

#### Ссылки II



- John L. Hennessy and David A. Patterson. 2011. Computer Architecture, Fifth Edition: A Quantitative Approach (5th ed.). Morgan Kaufmann Publishers Inc., San Francisco. CA. USA.
- Stavros Harizopoulos and Anastassia Ailamaki. 2006. Improving instruction cache performance in OLTP. ACM Trans. Database Syst. 31, 3 (September 2006), 887-920. DOI=http://dx.doi.org/10.1145/1166074.1166079
- Daniel Abadi, Peter Boncz, Stavros Harizopoulos. The Design and Implementation of Modern Column-Oriented Database Systems. Foundations and Trends(R) in Databases Vol. 5, No. 3 (2012) 197–280
- Stavros Harizopoulos, Daniel Abadi, Peter Boncz. Column-Oriented Database Systems. VLDB 2009 Tutorial (slides).
- Raghu Ramakrishnan and Johannes Gehrke. 2000. Database Management Systems (2nd ed.). Osborne/McGraw-Hill, Berkeley, CA, USA.